iT邦幫忙

2025 iThome 鐵人賽

DAY 6
0

大家好,鐵人賽堂堂邁入第六天!

昨天,我們學會了 n8n 的基礎,成功從外部世界獲取了資料。今天,我們要做一件更酷的事:為我們的工作流裝上一個真正的「大腦」—— AI Agent 節點

這個節點是 n8n AI 功能的核心,也是我們能將 MCP 思想發揮到極致的關鍵。現在,就讓我們來揭開它神秘的面紗!

一、首先,分清楚 LLM 與 AI Agent

在開始之前,我們必須先釐清一組非常重要的概念:大型語言模型 (LLM) 和 AI 代理人 (AI Agent) 有什麼不同?您可以透過下表快速理解:

特徵 大型語言模型 (LLM) AI 代理人 (AI Agent)
核心功能 理解並生成人類語言(文字)。 自主執行任務以達成目標。
自主性 反應式;需要提示。 主動式;可獨立運作。
互動 主要透過文字輸入/輸出。 與環境(數位/實體)互動,使用工具。
決策能力 有限,基於預訓練資料模式。 動態、適應性強,可規劃行動。
記憶 單次互動中通常無狀態(除非明確管理)。 通常具備短期和長期記憶。
工具使用 本身不具備(除非是代理人框架的一部分)。 整合並利用各種外部工具。
範圍 認知、基於語言的任務。 跨多個領域的複雜、多步驟任務。

簡單來說,LLM 是一個強大的「語言專家」,而 AI Agent 則是一個懂得如何運用這位專家和其他工具來完成任務的「專案經理」

二、AI Agent 的強大之處:工作情境展示

光看定義的比較可能還是有點抽象,讓我們透過一個具體的工作情境,來感受 AI Agent 究竟有多強大。

情境:行銷活動的自動化分析師

  • 使用者指令: 「幫我生成一份上週『夏日特賣』活動的社群成效簡報。」
  • LLM 單獨能做什麼?
    你需要手動去各個平台(Facebook、Google Analytics、Instagram)撈取數據,整理成文字,然後貼給 LLM,請它幫你潤飾成報告格式。
  • AI Agent 如何思考與行動?
    1. 思考: 「目標是『夏日特賣』的社群成效報告。我需要從 Facebook、Instagram 和 Google Analytics 獲取數據。」
    2. 使用工具: 呼叫 Facebook API 工具Instagram API 工具,查詢相關貼文的互動數據。
    3. 觀察: 得到各平台的按讚與分享數。
    4. 再次思考: 「社群數據有了,現在需要網站流量數據。」
    5. 使用工具: 呼叫 Google Analytics API 工具,查詢上週來自社群的流量與轉換率。
    6. 觀察: 得到訪客數與轉換率。
    7. 再次思考: 「所有數據都已集齊,現在進行整合與總結。」
    8. 最終回答: 達成目標,停止循環。
  • 最終產出 (AI Agent Output):

    上週「夏日特賣」社群成效簡報

    • 總覽: 本次活動社群迴響熱烈,成功引導大量流量至官網。
    • 社群互動: Facebook 總讚數 580,Instagram 總讚數 1,250。
    • 網站流量: 為官網帶來 3,500 名訪客,訪客轉換率達 2.5%。
    • 建議: Instagram 平台的互動成效顯著優於 Facebook,未來可考慮將更多預算投入 IG 平台。

三、深入核心:剖析 AI Agent 的「思考-行動」循環

那麼,AI Agent 是如何達成上述這些複雜任務的呢?讓我們透過 n8n 的執行日誌,來窺探它內部的運作機制。

假設我們向 AI Agent 提出一個簡單問題:「100 + 100 等於多少?」,並提供給它一個「計算機工具」。

截圖 2025-09-02 上午11.41.49

這張日誌截圖,清晰地展示了 AI Agent 的決策循環:

  1. 接收指令 (總指揮):
    最外層的 AI Agent 節點接收了我們的原始指令:「100 + 100 = ?」。

  2. 思考 (Thought):
    Agent 啟用它的大腦 (第一個 Google Gemini Chat Model),進行思考:「這個問題是關於數學計算。我的手邊有一個『計算機工具』,我應該把『100 + 100』這個表達式傳給它。」 LLM 最終決定呼叫 Calculator 工具。

  3. 行動 (Action):
    接著,MCP Client (或類似的工具呼叫機制) 被啟用。它的職責就是接收大腦的決策,並實際去觸發『計算機工具』的工作流。這一步完美模擬了 MCP 協議的 tools/call 行為。

  4. 觀察 (Observation) & 再次思考:
    工具執行完畢,回傳了結果 200。AI Agent 的大腦 (第二個 Google Gemini Chat Model) 再次啟動,它觀察到這個結果,並思考:「200 這個結果完美地回答了原始問題。任務完成。」

  5. 最終輸出 (Final Answer):
    LLM 將 200 作為最終答案呈現給使用者,整個循環結束。

這個「思考 → 行動 → 觀察 → 再次思考」的循環,正是 AI Agent 能夠自主完成複雜任務的秘密所在。

四、今日總結

今天我們解鎖了 n8n 中最核心的 AI 功能。我們理解到:

  • AI Agent 是一個懂得使用工具自主規劃的「專案經理」,遠比單純的 LLM 強大。
  • Agent 的工作模式是一個思考-行動-觀察的循環,直到達成最終目標。

理論已經完備,工作情境也已瞭描繪。從明天開始,我們就要親自動手,在 n8n 中為我們的 AI Agent 打造出第一個專屬工具!


上一篇
Day 5 - 你的第一個 n8n 工作流:從手動觸發到 HTTP 請求
下一篇
Day 7 - 使用 n8n 建構 MCP
系列文
三十天解鎖上下文超能力:MCP 實戰9
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言